Herramienta de apoyo en la detección de reutilización de código fuente

نویسندگان

  • Raymundo Picazo-Alvarez
  • Esaú Villatoro-Tello
  • Wulfrano Arturo Luna-Ramírez
  • Carlos R. Jaimez González
چکیده

Resumen. El acto de tomar parcial o totalmente contenidos generados por otras personas, y presentarlos como propios, sin dar el crédito correspondiente a los autores, es una forma indebida de reutilización de contenidos, considerada como plagio. Desafortunamente, en la actualidad, dada la amplia disponibilidad de contenidos a través de Internet, esta práctica se ha incrementado. La gran mayoŕıa de los contenidos disponibles en la Web son materiales multimedia, aplicaciones y sobre todo textos, y todos ellos son susceptibles de plagio. En este art́ıculo se hace énfasis en una clase de textos en particular: los programas escritos en algún lenguaje de programación, denominados código fuente. Dada la facilidad de acceso y las prácticas de reutilización de contenidos sin citar las fuentes (el abuso de la posibilidad de “Copiar y Pegar”, derivado de deficiencias metodológicas o bien como acción deliberada), surge la necesidad de contar con herramientas para combatir el plagio, en especial, de código fuente. En el presente trabajo se propone una herramienta orientada a detectar la reutilización de código fuente en programas escritos en un mismo lenguaje de programación. Las técnicas aplicadas se basan en la detección de la similitud entre dos programas, a través del uso de su Frecuencia de Términos (TF) y su Frecuencia Inversa (TF-IDF), considerando como términos conjuntos de n-gramas de caracteres presentes en cada uno de ellos.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Soporte Automatizado a la reutilización de requisitos

Resumen. La Ingeniería de Requisitos es una disciplina en auge, que ha demostrado su capacidad de influencia en la mejora de la productividad y calidad en los procesos y productos software. Para facilitar su aplicación, es necesario disponer de herramientas CARE (Computer-Aided Requirements Engineering) que den un buen soporte a sus distintas actividades. Una de estas actividades, que se ha rev...

متن کامل

Soporte de Métricas con Independencia del Lenguaje para la Inferencia de Refactorizaciones

Uno de los problemas actuales a la hora de refactorizar el código radica en cuándo refactorizar. Hasta el momento, la mayoría de propuestas establecen que el proceso de refactorización nace de la intuición y experiencia del programador. Partiendo del concepto de “Bad Smell” y a través de métricas, existe la posibilidad de plantear su existencia, no desde un punto de vista subjetivo donde la opi...

متن کامل

Un perfil UML para el análisis de series temporales con modelos conceptuales sobre almacenes de datos

El análisis de series temporales (AST) es una potente herramienta para el descubrimiento de patrones y tendencias. Pero todav́ıa no existen modelos conceptuales para esta técnica de mineŕıa, que podŕıan ayudar a solventar los problemas en el preprocesado de los grandes volúmenes de datos manejados. Dado que los almacenes de datos (AD) constituyen una fuente de datos idónea para la mineŕıa, propo...

متن کامل

Identificación de Patrones de Reutilización de Requisitos de Sistemas de Información

Resumen En este artículo se exponen algunos de los resultados de la aplicación de las plantillas y patrones de requisitos presentadas en la edición previa del WER [6]. Uno de los resultados más interesantes de la normalización del formato de los requisitos ha sido la posibilidad de compararlos e identificar patrones de reutilización, tanto a nivel de requisitos de cliente (requisitos–C, normalm...

متن کامل

EDROOM, Herramienta Libre de Modelado y Generación Automática de Código para Sistemas de Tiempo Real

Resumen. El desarrollo de sistemas de tiempo real es una tarea de considerable complejidad. Desde el área de la ingenieŕıa del software se han propuesto, en las últimas décadas, diversos lenguajes de modelado que pretenden facilitar el proceso de desarrollo. Los modelos de los sistemas aśı obtenidos se basan en formalismos, estructuras o diagramas que proporcionan un nivel de abstracción adecua...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Research in Computing Science

دوره 73  شماره 

صفحات  -

تاریخ انتشار 2014